iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 5
0
自我挑戰組

資料處理以及視覺化系列 第 5

R語言-第五天的鐵達尼 - 條件搜尋統計

  • 分享至 

  • xImage
  •  

上一篇得知平均票價32美元 , 這跟我認知中鐵達尼號的樣子真的是差很多XD
藉由dplyr包我們也可以快速理解一下票價的關係

#以社經地位統計平均票價
raw %>% group_by(Pclass) %>% summarise(平均票價 = mean(Fare))
# A tibble: 3 x 2
  Pclass 平均票價
   <int>    <dbl>
1      1     84.2
2      2     20.7
3      3     13.7

Pclass 社會經濟地位等級(1:高等、2:中等、3:低等)

目前以社經地位平均票價來看 , 社經地位越高確實平均票價都會比較高

那如果以存活與否呢...?

raw %>% group_by(Survived) %>% summarise(平均票價 = mean(Fare))
# A tibble: 2 x 2
  Survived 平均票價
     <int>    <dbl>
1        0     22.1
2        1     48.4

Survived 是否存活(0:否、1:是)
好吧!太殘酷了...我不忍看

確實都是與票價有關係的....


上一篇
R語言-第四天的鐵達尼 - 基本資訊Q2、Q3
下一篇
R語言-第六天的鐵達尼 - 字串處理
系列文
資料處理以及視覺化30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言